Un algorithme de classification topographique non supervisée à deux niveaux simultanés
نویسندگان
چکیده
Résumé. Une des questions les plus importantes pour la plupart des applications réelles de la classification est de déterminer un nombre approprié de groupes (clusters). Déterminer le nombre optimal de groupes est un problème difficile, puisqu’il n’y a pas de moyen simple pour connaître ce nombre sans connaissance a priori. Dans cet article, nous proposons un nouvel algorithme de classification non supervisée à deux niveaux, appelé S2L-SOM (Simultaneous Twolevel Clustering Self Organizing Map), qui permet de déterminer automatiquement le nombre optimal de groupes, pendant l’apprentissage d’une carte auto-organisatrice. L’estimation du nombre correct de groupes est en relation avec la stabilité de la segmentation et la validité des groupes générés. Pour mesurer cette stabilité nous utilisons une méthode de sous-échantillonnage. Le principal avantage de l’algorithme proposé, comparé aux méthodes classiques de classification, est qu’il n’est pas limité à la détection de groupes convexes, mais est capable de détecter des groupes de formes arbitraires. La validation expérimentale de cet algorithme sur un ensemble de problèmes fondamentaux pour la classification montre sa supériorité sur les méthodes standards de classification à deux niveaux comme SOM+K-Moyennes et SOM+HierarchicalAgglomerative-Clustering.
منابع مشابه
Segmentation d'images par modèle de mélange conjoint non gaussien
RÉSUMÉ. L’idée à l’origine du modèle de mélange conjoint (MMConjoint) est de classer simultanément deux ensembles d’observations en introduisant un a priori conjoint entre les deux classifications et un lien statistique entre les deux observations. Nous étudions en particulier le cas de mélanges gaussiens et le cas de mélanges paramétriques non gaussiens construits à partir de copules et de mar...
متن کاملCartes de communautés pour l'adaptation interactive de profils dans un système de filtrage d'information
RÉSUMÉ. Dans le contexte actuel de surcharge d’informations, les utilisateurs peuvent s’en remettre à des systèmes de filtrage qui leur recommandent en permanence, en se basant sur leur profil, des informations vraisemblablement pertinentes. Néanmoins, un changement dans leur besoin d’information n’est pas toujours bien pris en compte à cause du rôle relativement passif des utilisateurs dans la...
متن کاملClassification probabiliste non supervisée et visualisation des données séquentielles
Résumé. Nous proposons dans ce papier un nouvel algorithme de classification non supervisée à base de modèle de mélange topologique pour des données non i.i.d (non independently and identically distributed). Ce nouveau paradigme probabiliste, plonge les cartes topologiques probabilistes dans une formulation sous forme de chaînes de Markov cachées. Dans cette formulation, la génération d’une obs...
متن کاملClassification relationnelle topographique
Résumé : Ce papier présente un formalisme relationnel pour la classification topographique de données qualitatives (ou catégorielles), se présentant sous forme d’une matrice binaire ou d’une somme de matrices binaires. L’algorithme de la classification relationnelle topographique proposé s’inspire du modèle de Kohonen (conservation de l’ordre topologique) et utilise le formalisme de l’Analyse R...
متن کاملUne nouvelle approche pour la classification non supervisée en segmentation d'image
Résumé. La segmentation des images en régions est un problème crucial pour l’analyse et la compréhension des images. Parmi les approches existantes pour résoudre ce problème, la classification non supervisée est fréquemment employée lors d’une première étape pour réaliser un partitionnement de l’espace des intensités des pixels (qu’il s’agisse de niveaux de gris, de couleurs ou de réponses spec...
متن کامل